標簽【[89]Big Data】

Spark Streaming實時計算框架介紹隨着大數據的發展，人們對大數據的處理要求也越來越高，原有的批處理框架MapReduce適合離線計算，卻無法滿足實時性要求較高的業務，如實 ...

Kafka與Logstash的數據采集基於Logstash跑通Kafka還是需要注意很多東西，最重要的就是理解Kafka的原理。 Logstash工作原理由於Kafk ...

Elasticsearch索引mapping的寫入、查看與修改 https://blog.csdn.net/napoay/article/details/52012249 首先創建一個索引： c ...

大數據平台的數據采集數據采集的設計，幾乎完全取決於數據源的特性，畢竟數據源是整個大數據平台蓄水的上游，數據采集不過是獲取水源的管道罷了。在數據倉庫的語境下，ETL基本上就是數據采集的代 ...

日志收集之kafka

日志收集之kafka http://www.jianshu.com/p/f78b773ddde5 一、介紹　　Kafka是一種分布式的，基於發布/訂閱的消息系統。主要設計目標如下：以 ...

Elasticsearch 的坑爹事——記錄一次mapping field修改過程 http://www.cnblogs.com/Creator/p/3722408.html Elasticsea ...

windows curl 命令

windows 64 curl 命令的使用 https://blog.csdn.net/qq_27093465/article/details/53545693 curl命令可以通過命令行的方式， ...

Kafka是分布式發布-訂閱消息系統 https://www.biaodianfu.com/kafka.html Kafka是分布式發布-訂閱消息系統。它最初由LinkedIn公司開發，之后成為A ...

隱馬爾可夫模型(HMM) 原文地址：http://www.cnblogs.com/jacklu/p/7753471.html 本文結合了王曉剛老師的ENGG 5202 Patte ...

SPARK如何使用AKKA實現進程、節點通信《深入理解Spark：核心思想與源碼分析》一書前言的內容請看鏈接《深入理解SPARK：核心思想與源碼分析》一書正式出版上市《深入理解Spar ...